Feature reuse has been a key technique in light-weight convolutional neural networks (CNNs) design. Current methods usually utilize a concatenation operator to keep large channel numbers cheaply (thus large network capacity) by reusing feature maps from other layers. Although concatenation is parameters- and FLOPs-free, its computational cost on hardware devices is non-negligible. To address this, this paper provides a new perspective to realize feature reuse via structural re-parameterization technique. A novel hardware-efficient RepGhost module is proposed for implicit feature reuse via re-parameterization, instead of using concatenation operator. Based on the RepGhost module, we develop our efficient RepGhost bottleneck and RepGhostNet. Experiments on ImageNet and COCO benchmarks demonstrate that the proposed RepGhostNet is much more effective and efficient than GhostNet and MobileNetV3 on mobile devices. Specially, our RepGhostNet surpasses GhostNet 0.5x by 2.5% Top-1 accuracy on ImageNet dataset with less parameters and comparable latency on an ARM-based mobile phone.
translated by 谷歌翻译
在本文中,我们提出了与IEEE计算机协会在CVPR 2022上同时与IEEE计算机协会研讨会同时举行的多手术检测挑战。我们的多手术检测挑战旨在检测自动图像操作,包括但不限于图像编辑,图像合成,图像合成,图像,图像,图像,图像合成,图像,图像编辑一代,图像Photoshop等。我们的挑战吸引了来自世界各地的674支团队,约有2000个有效的结果提交数量。我们邀请了前十支球队为挑战提供解决方案,其中三支球队在大结局中获得了奖项。在本文中,我们介绍了前三名团队的解决方案,以增强图像伪造检测领域的研究工作。
translated by 谷歌翻译
作为一种新颖的深度学习模型,GCFOREST已被广泛用于各种应用中。但是,当前的GCFOREST多透明扫描会产生许多冗余特征向量,这增加了模型的时间成本。为了筛选冗余特征向量,我们引入了一种用于多透明扫描的哈希筛选机制,并提出了一种称为HW-Forest的模型,该模型采用了两种策略,即哈希筛选和窗口筛选。 HW-Forest采用感知散列算法来计算哈希筛选策略中特征向量之间的相似性,该策略用于删除由多透明扫描产生的冗余特征向量,并可以大大降低时间成本和记忆消耗。此外,我们采用了一种自适应实例筛选策略来提高我们的方法的性能,称为窗口筛选,可以实现更高的精度,而无需在不同数据集上进行超参数调整。我们的实验结果表明,HW-Forest的精度比其他模型更高,并且时间成本也降低。
translated by 谷歌翻译
本文介绍了Davarocr,这是一种用于OCR和文档理解任务的开源工具箱。Davarocr目前实施19种高级算法,涵盖9个不同的任务表。Davarocr为每种算法提供了详细的用法说明和经过训练的模型。与以前的OpenSource OCR工具箱相比,Davarocr对文档理解的尖端技术的子任务具有相对完整的支持。为了促进OCR技术在学术界和行业中的开发和应用,我们更加关注使用不同的技术可以共享的模块的使用。Davarocr在https://github.com/hikopensource/davar-lab-ocr上公开发行。
translated by 谷歌翻译
联合学习(FL)是一种分布式机器学习技术,可以在避免明确的数据共享的同时进行协作模型培训。 FL算法的固有保护属性使其对医疗领域特别有吸引力。但是,如果有异质的客户数据分布,则标准FL方法是不稳定的,需要密集的超参数调整以实现最佳性能。常规的超参数优化算法在现实世界中的FL应用中是不切实际的,因为它们涉及大量的培训试验,而计算预算有限,这些试验通常是不起作用的。在这项工作中,我们提出了一种有效的增强学习(RL)的联合次数超参数优化算法,称为自动FEDRL,其中在线RL代理可以根据当前的培训进度动态调整每个客户的超参数。进行了广泛的实验以研究不同的搜索策略和RL代理。该方法的有效性在CIFAR-10数据集的异质数据分配以及两个现实世界中的医学图像分割数据集上进行了验证,用于胸部CT中的COVID-19变病变分段,腹部CT中的胰腺细分。
translated by 谷歌翻译
作为深度学习模式,深入信心筛查森林(GClestcs)在各种应用中取得了巨大的成功。与传统的深森林方法相比,GcForestcs通过将一些实例直接传递到最后阶段,有效地减少了高度的情况。然而,在高置信区中存在一组具有低精度的实例,其被称为错误分区的实例。要查找这些错误分区实例,本文提出了一个深入的融合信心筛选森林(DBC-Forest)模型,基于他们的信心将所有情况包装成垃圾箱。以这种方式,可以将更准确的实例传递到最终阶段,并且性能得到改善。实验结果表明,DBC-Forest对相同的超参数实现高度准确的预测,比其他类似模型更快,以实现相同的准确性。
translated by 谷歌翻译
评估生成的对抗网络(GANS)的表现是由于其实际意义的重要课题。虽然已经提出了几种评估指标,但它们通常会评估整个产生的图像分布的质量。对于参考标制图像合成(RIS)任务,即呈现另一参考图像的样式的源图像,其中,在评估单个生成图像的质量至关重要时,这些度量不适用于这些度量。在本文中,我们提出了一般学习的框架,参考引导图像合成评估(RISA)来定量地评估单个生成图像的质量。值得注意的是,RISA的培训不需要人类注释。具体而言,RISA的训练数据由RIS中的培训过程中的中间模型获取,并且基于图像质量与迭代之间的正相关性,通过模型迭代的数量弱写。由于该注释作为监督信号太粗糙,我们介绍了两种技术:1)一种像素 - 明智的插值方案,以改进粗标签,以及2)多个二进制分类器来替换NA \“IVE回归。此外,无人监督引入对比损失以有效地捕获所生成的图像及其参考图像之间的风格相似性。各种数据集的经验结果表明,RISA与人偏好和跨越模型的井中转移良好。
translated by 谷歌翻译
Imbalanced-leasemble,缩写为IMBens,是一个开源Python工具箱,用于快速实现和部署类别 - 不平衡数据的集合学习算法。它提供对多个最先进的集合不平衡学习(EIL)方法,可视化器和公用事业功能的访问,以处理类别不平衡问题。这些集合方法包括基于重采样的,例如/过度采样,以及重量基于/过度采样,例如,敏感的学习。除了实现之外,我们还扩展了传统的二进制EIL算法,与多级支持和重采样调度程序等新功能,从而使它们能够处理更复杂的任务。该软件包是在简单的,良好的API设计中开发的,遵循Scikit-Gearn的易于使用。 IMBens在MIT开源许可证下发布,可以从Python包索引(PYPI)安装。 https://github.com/zhiningliu1998/imbalanced-ensemble可以使用源代码,二进制文件,详细文档和使用示例。
translated by 谷歌翻译
基于深度学习(DL)磁共振(MR)图像重建的方法已被证明近年来产生卓越的性能。但是,这些方法只利用被采样的数据,或者需要配对的全采样辅助模型来执行多模态重建。因此,现有的方法忽略了探索可以将纹理从引用完全采样数据转移到单个模态内的欠采样数据的注意力机制,这限制了这些方法在具有挑战性的情况下。在本文中,我们提出了一种新颖的纹理变压器模块(TTM),用于加速MRI重建,其中我们将欠采样的数据和参考数据作为验证和键在变压器中装订。 TTM促进了跨越采样和参考数据的联合特征学习,因此可以通过注意,在重建期间可以利用精确的纹理特征来发现特征对应关系。值得注意的是,所提出的TTM可以依赖于先前的MRI重建方法,以进一步提高其性能。广泛的实验表明,TTM可以显着提高几个流行的基于DL的MRI重建方法的性能。
translated by 谷歌翻译
Blind image quality assessment (BIQA) remains challenging due to the diversity of distortion and image content variation, which complicate the distortion patterns crossing different scales and aggravate the difficulty of the regression problem for BIQA. However, existing BIQA methods often fail to consider multi-scale distortion patterns and image content, and little research has been done on learning strategies to make the regression model produce better performance. In this paper, we propose a simple yet effective Progressive Multi-Task Image Quality Assessment (PMT-IQA) model, which contains a multi-scale feature extraction module (MS) and a progressive multi-task learning module (PMT), to help the model learn complex distortion patterns and better optimize the regression issue to align with the law of human learning process from easy to hard. To verify the effectiveness of the proposed PMT-IQA model, we conduct experiments on four widely used public datasets, and the experimental results indicate that the performance of PMT-IQA is superior to the comparison approaches, and both MS and PMT modules improve the model's performance.
translated by 谷歌翻译